Asymmetric Numeral Systems

Asymmetric Numeral Systems (asymetryczne systemy liczbowe, ANS)^[1] – rodzina kodowań entropijnych wprowadzonych przez dr. Jarosława Dudę^[2] na przestrzeni lat 2006–2014, używanych w kompresji danych od 2014 roku^[3] z powodu poprawionej wydajności w porównaniu z używanymi dotychczas metodami: ANS pozwala połączyć stopień kompresji kodowania arytmetycznego (używa praktycznie dokładnych prawdopodobieństw), z kosztem przetwarzania podobnym jak w kodowaniu Huffmana (przybliżającym prawdopodobieństwa potęgami 1/2). W wariancie tANS jest to osiągnięte przez skonstruowanie automatu skończonego w celu przetwarzania dużego alfabetu bez użycia mnożenia.

ANS jest m.in. użyte w kompresorze Zstandard z Facebook^[4]^[5] (także używany m.in. w jądrze systemu Linux^[6], przeglądarce Google Chrome^[7], Android^[8], został opublikowany jako RFC 8478 ↓ dla MIME^[9] i HTTP^[10]), w kompresorze LZFSE z Apple^[11], kompresorze 3D Draco^[12] i obrazu PIK z Google^[13], kompresorze DNA CRAM^[14] z SAMtools, bibliotece do szybkiej kompresji Nvidia nvCOMP^[15], kompresorze DivANS z Dropbox^[16], Microsoft BCPack kompresji tekstur (komponent DirectX)^[17], oraz w standardzie kompresji obrazu JPEG XL^[18].

Podstawową koncepcją ANS jest zapisanie informacji w pojedynczej liczbie naturalnej $x.$ W standardowym systemie liczbowym możemy dodać bit informacji $s\in \{0,1\}$ do informacji już zawartej w liczbie $x$ poprzez wstawienie go na ostatniej pozycji, prowadząc do liczby $x'=2x+s.$ Dla kodowania entropijnego jest to optymalne o ile $\Pr(0)=\Pr(1)=1/2.$ ANS uogólnia ten proces do dowolnego zestawu symboli $s\in S$ z założonym rozkładem prawdopodobieństwa $(p_{s})_{s\in S}.$ Nowa liczba $x'$ jest rezultatem dodania informacji z $s$ do liczby $x$ używając przybliżonej zależności: $x'\approx x/p_{s}.$ Równoważnie: $\log _{2}(x')\approx \log _{2}(x)+\log _{2}(1/p_{s}),$ gdzie $\log _{2}(x)$ jest ilością bitów informacji zapisanych w liczbie $x$ oraz $\log _{2}(1/p_{s})$ jest ilością bitów zawartą w symbolu $s.$

Reguła kodowania jest ustalana poprzez podział zbioru liczb naturalnych na rozłączne podzbiory odpowiadające poszczególnym symbolom – jak na liczby parzyste i nieparzyste, ale tym razem z gęstościami odpowiadającymi założonemu rozkładowi prawdopodobieństwa symboli. Żeby dodać informację z symbolu $s$ do informacji już zapisanej w aktualnej liczbie $x,$ przechodzimy do liczby $x'=C(x,s)\approx x/p$ będącej $x$ -tym wystąpieniem z $s$ -tego podzbioru.

Kilka różnych sposobów jest wykorzystywanych, żeby użyć ANS w praktyce – bezpośrednie formuły matematyczne dla kroku kodowania i dekodowania (warianty uABS i rANS), lub można w całości stablicować zachowanie (wariant tANS). Żeby zapobiec ucieczce $x$ do nieskończoności, używana jest renormalizacja – przesłanie najmłodszych bitów do lub ze strumienia.

↑ J. Duda, K. Tahboub, N. J. Gadil, E. J. Delp, The use of asymmetric numeral systems as an accurate replacement for Huffman coding, Picture Coding Symposium, 2015.
↑ Wiadomości Uniwersytetu Jagiellońskiego: Używasz Facebooka lub Apple’a? Twoje dane są zapisane kodowaniem z UJ.
↑ List of compressors using ANS, implementations and other materials.
↑ Smaller and faster data compression with Zstandard, Facebook, August 2016.
↑ 5 ways Facebook improved compression at scale with Zstandard, Facebook, December 2018.
↑ Zstd Compression For Btrfs & Squashfs Set For Linux 4.14, Already Used Within Facebook, Phoronix, September 2017.
↑ New in Chrome 123 (Content-Encoding), Google, March 2024.
↑ Zstd w Android P.
↑ Zstandard Compression and The application/zstd Media Type (email standard).
↑ Hypertext Transfer Protocol (HTTP) Parameters, IANA.
↑ Apple Open-Sources its New Compression Algorithm LZFSE, InfoQ, July 2016.
↑ Google Draco 3D compression library.
↑ Google PIK: new lossy image format for the internet.
↑ CRAM format specification (version 3.0).
↑ High Speed Data Compression Using NVIDIA GPUs.
↑ Building better compression together with DivANS.
↑ Microsoft DirectStorage overview.
↑ Committee Draft of JPEG XL Image Coding System.

[PCS2015-1] J. Duda, K. Tahboub, N. J. Gadil, E. J. Delp, The use of asymmetric numeral systems as an accurate replacement for Huffman coding, Picture Coding Symposium, 2015.

[UJ-2] Wiadomości Uniwersytetu Jagiellońskiego: Używasz Facebooka lub Apple’a? Twoje dane są zapisane kodowaniem z UJ.

[list-3] List of compressors using ANS, implementations and other materials.

[ZSTD-4] Smaller and faster data compression with Zstandard, Facebook, August 2016.

[ZSTD1-5] 5 ways Facebook improved compression at scale with Zstandard, Facebook, December 2018.

[Linux-6] Zstd Compression For Btrfs & Squashfs Set For Linux 4.14, Already Used Within Facebook, Phoronix, September 2017.

[Chrome-7] New in Chrome 123 (Content-Encoding), Google, March 2024.

[Android-8] Zstd w Android P.

[MIME-9] Zstandard Compression and The application/zstd Media Type (email standard).

[HTTP-10] Hypertext Transfer Protocol (HTTP) Parameters, IANA.

[LZFSE-11] Apple Open-Sources its New Compression Algorithm LZFSE, InfoQ, July 2016.

[Draco-12] Google Draco 3D compression library.

[PIK-13] Google PIK: new lossy image format for the internet.

[CRAM-14] CRAM format specification (version 3.0).

[nvCOMP-15] High Speed Data Compression Using NVIDIA GPUs.

[DivANS-16] Building better compression together with DivANS.

[BCPack-17] Microsoft DirectStorage overview.

[jpegxl_committeedraft-18] Committee Draft of JPEG XL Image Coding System.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]